27 research outputs found

    Leveraging distant supervision for improved named entity recognition

    Full text link
    Les techniques d'apprentissage profond ont fait un bond au cours des dernières années, et ont considérablement changé la manière dont les tâches de traitement automatique du langage naturel (TALN) sont traitées. En quelques années, les réseaux de neurones et les plongements de mots sont rapidement devenus des composants centraux à adopter dans le domaine. La supervision distante (SD) est une technique connue en TALN qui consiste à générer automatiquement des données étiquetées à partir d'exemples partiellement annotés. Traditionnellement, ces données sont utilisées pour l'entraînement en l'absence d'annotations manuelles, ou comme données supplémentaires pour améliorer les performances de généralisation. Dans cette thèse, nous étudions comment la supervision distante peut être utilisée dans un cadre d'un TALN moderne basé sur l'apprentissage profond. Puisque les algorithmes d'apprentissage profond s'améliorent lorsqu'une quantité massive de données est fournie (en particulier pour l'apprentissage des représentations), nous revisitons la génération automatique des données avec la supervision distante à partir de Wikipédia. On applique des post-traitements sur Wikipédia pour augmenter la quantité d'exemples annotés, tout en introduisant une quantité raisonnable de bruit. Ensuite, nous explorons différentes méthodes d'utilisation de données obtenues par supervision distante pour l'apprentissage des représentations, principalement pour apprendre des représentations de mots classiques (statistiques) et contextuelles. À cause de sa position centrale pour de nombreuses applications du TALN, nous choisissons la reconnaissance d'entité nommée (NER) comme tâche principale. Nous expérimentons avec des bancs d’essai NER standards et nous observons des performances état de l’art. Ce faisant, nous étudions un cadre plus intéressant, à savoir l'amélioration des performances inter-domaines (généralisation).Recent years have seen a leap in deep learning techniques that greatly changed the way Natural Language Processing (NLP) tasks are tackled. In a couple of years, neural networks and word embeddings quickly became central components to be adopted in the domain. Distant supervision (DS) is a well-used technique in NLP to produce labeled data from partially annotated examples. Traditionally, it was mainly used as training data in the absence of manual annotations, or as additional training data to improve generalization performances. In this thesis, we study how distant supervision can be employed within a modern deep learning based NLP framework. As deep learning algorithms gets better when massive amount of data is provided (especially for representation learning), we revisit the task of generating distant supervision data from Wikipedia. We apply post-processing treatments on the original dump to further increase the quantity of labeled examples, while introducing a reasonable amount of noise. Then, we explore different methods for using distant supervision data for representation learning, mainly to learn classic and contextualized word representations. Due to its importance as a basic component in many NLP applications, we choose Named-Entity Recognition (NER) as our main task. We experiment on standard NER benchmarks showing state-of-the-art performances. By doing so, we investigate a more interesting setting, that is, improving the cross-domain (generalization) performances

    Coreference resolution with and for Wikipedia

    Get PDF
    Wikipédia est une ressource embarquée dans de nombreuses applications du traite- ment des langues naturelles. Pourtant, aucune étude à notre connaissance n’a tenté de mesurer la qualité de résolution de coréférence dans les textes de Wikipédia, une étape préliminaire à la compréhension de textes. La première partie de ce mémoire consiste à construire un corpus de coréférence en anglais, construit uniquement à partir des articles de Wikipédia. Les mentions sont étiquetées par des informations syntaxiques et séman- tiques, avec lorsque cela est possible un lien vers les entités FreeBase équivalentes. Le but est de créer un corpus équilibré regroupant des articles de divers sujets et tailles. Notre schéma d’annotation est similaire à celui suivi dans le projet OntoNotes. Dans la deuxième partie, nous allons mesurer la qualité des systèmes de détection de coréférence à l’état de l’art sur une tâche simple consistant à mesurer les mentions du concept décrit dans une page Wikipédia (p. ex : les mentions du président Obama dans la page Wiki- pédia dédiée à cette personne). Nous tenterons d’améliorer ces performances en faisant usage le plus possible des informations disponibles dans Wikipédia (catégories, redi- rects, infoboxes, etc.) et Freebase (information du genre, du nombre, type de relations avec autres entités, etc.).Wikipedia is a resource of choice exploited in many NLP applications, yet we are not aware of recent attempts to adapt coreference resolution to this resource, a prelim- inary step to understand Wikipedia texts. The first part of this master thesis is to build an English coreference corpus, where all documents are from the English version of Wikipedia. We annotated each markable with coreference type, mention type and the equivalent Freebase topic. Our corpus has no restriction on the topics of the documents being annotated, and documents of various sizes have been considered for annotation. Our annotation scheme follows the one of OntoNotes with a few disparities. In part two, we propose a testbed for evaluating coreference systems in a simple task of measuring the particulars of the concept described in a Wikipedia page (eg. The statements of Pres- ident Obama the Wikipedia page dedicated to that person). We show that by exploiting the Wikipedia markup (categories, redirects, infoboxes, etc.) of a document, as well as links to external knowledge bases such as Freebase (information of the type, num- ber, type of relationship with other entities, etc.), we can acquire useful information on entities that helps to classify mentions as coreferent or not

    THE RELATIONSHIP BETWEEN CAFFEINE ADDICTION AND STRESS AMONG LEBANESE MEDICAL STUDENTS IN LEBANON

    Get PDF
    Stress and behavioral addiction are becoming major health problems growing in strength and prevalence. They are often associated with a large array of debilitating diseases and conditions including psychosocial impairments. Medical students remain a vulnerable territory for developing stress and addiction mainly relating to caffeine consumption. Methods: A cross-sectional design was utilized in this study. Results: The study revealed that academic and learning issues are the most stressful and alarming levels of caffeine dependence. Conclusions: This showed a high impact of academic issues on medical students stress and performance, which mandates thorough actions to be considered by both medical institutions and medical students to fight this stress and maintain a healthier life and academic development

    Investigating Data Similarity and Estimation Through Spatio-Temporal Correlation to Enhance Energy Efficiency in WSNs

    Get PDF
    International audienceWireless sensor networks are of energy-constrained nature, which calls for energy efficient protocols as a primary design goal. Thus, minimizing energy consumption is a main challenge.We are concerned in howcollected data by sensors, can be processed to increase the relevance of certain mass of data and reduce the overall data traffic. Since sensor nodes are often densely deployed, the data collected by nearby nodes are either redundant or correlated. One of the great challenges for the aforementioned problem is to exploit temporal and spatial correlation among the source nodes. Our work is composed of two main tasks: 1- A predictive modeling task that aims to capture the temporal correlation among collected data. 2- A data similarity detection task that measures the data similarity based on the spatial correlation

    Whole-body gene expression atlas of an adult metazoan

    No full text

    Dynamique de renversement de l aimantation dans les nanofils ferromagnétiques

    No full text
    Les nanotechnologies recouvrent un grand nombre de domaines technologiques ayant pour dénominateur commun la taille nanométriqne des structures (un nanomètre = un millième de micron). Les progrès accomplis dans la maîtrise de la matière à l échelle du nanomètre ouvrent des perspectives nouvelles, sources d enjeux scientifiques, techniques et économiques majeurs dans des champs d activité variés et au croisement de plusieurs disciplines. L étude et l utilisation de matériaux nanostructurés de basse dimension (films 2D, fils 1D et grains 0D) connaissent actuellement un essor considérable en raison de leurs propriétés particulières par rapport aux matériaux massifs (3D). L objectif de la thèse est de corréler les conditions d élaboration et les propriétés structurales et magnétiques de matériaux à travers l étude des nanofils de Nickel et de Cobalt, La première partie du travail concerne l élaboration des nanofils par un procédé de l électrodéposition dans les pores de membranes de polycarbonate. L analyse des processus d électrodéposition a conduit à la compréhension de certains mécanismes de la synthèse spécifique des nano-matériaux. La caractérisation structurale et la détermination de la composition chimique des nanofils électrodéposés sont y également présentées. La seconde partie de thèse concerne les propriétés magnétiques des nanofils. Les caractérisations magnétiques sont faites à l aide d une magnétométrie VSM et d un dispositif de la résonance ferromagnétique FMR. L étude quasi-statique de renversement de l aimantation effectuée au cours des travaux de thèse a montré la présence de plusieurs modes de retournement de l aimantation dans les nanofils en dépendance avec la géométrie des fils. L étude de la dynamique de renversement de l aimantation a confirmé les résultats relatifs à ce phénomène en statique et a mis en évidence la possibilité de contrôler le champ effectif d anisotropie magnétique dans les réseaux des nanofils. Les études FMR (9 GHz, basse température) ont montré la présence des nouveaux effets qui influencent l anisotropie magnétique de l échantillon. Les résultats obtenus sont interprétés et simulés numériquement à l aide de différents modèles théoriques (renversement uniforme de Stoner-Wohlfarth, renversement non-uniforme ou curling , modèle de Preisach et modèle de Landau-Lifshitz-Gilbert). On constate un bon accord entre théorie et expérience.Nanotechnology encompasses large number of scientific and technical areas with a common length of interest, the nanometer (a thousandth of a micron). Progress in the control of matter al the nanometer scale opens new opportunities, scientific challenge, technical and economic challenges in various economy sectors and at the crossing point of several fields. The study and use of reduced dimension (2D films, 1D wires and 0D grains) nanostructured materials generates substantial progress due to their unique properties compared to bulk materials (3D). The objective of this thesis is to correlate conditions of preparation, to structural and magnetic properties of materials through the study of nanowires made of nickel and cobalt. The first part of this work involves production of nanowires in polycarbonate membrane pores. Determination of growth conditions allowed us to obtain high quality nanowires. Analysis of the electroplating process led to the understanding of growth mechanisms pertaining to nanomaterials. Structural characterization and determination of the chemical composition of electrodeposited nanowires are also presented. In the second part, we study the magnetic properties of the nanowires. Magnetic characterisation is based on VSM magnetometry and FMR. The quasi-static study of magnetization reversal reveals the presence of several modes of magnetization reversal depending on the nanowire geometry. Dynamic (frequency) studies confirm our static (zero frequency) results and allow us to control the effective anisotropy field strength in nanowire arrays. FMR measurements at low temperature unveiled the presence f novel terms in addition b tire magnetic anisotropy of the sample. Our studies are interpreted using several theoretical models such as Stoner-Wohlfarth, Curling , Preisach and Landau-Lifshitz-Cilbert . Good agreement is obtained between theory and experiment in our work.BREST-BU Droit-Sciences-Sports (290192103) / SudocSudocFranceF

    Effects of anodization and electrodeposition conditions on the growth of copper and cobalt nanostructures in aluminum oxide films

    No full text
    International audienceAnodic aluminum oxide (AAO) films were prepared by alternative current (ac) oxidation in sulfuric acid and phosphoric acid solution. The porous structure of the AAO templates was probed by ac electrodeposition of copper. AAO templates grown using an applied square waveform signal in cold sulfuric acid solution exhibit a greater pore density and a more homogeneous barrier layer. UV–vis–NIR reflectance spectra of the Cu/AAO assemblies exhibit a plasmon absorption peak centered at 580 nm, consistent with the formation of Cu nanostructures slightly larger than 10 nm in diameter. Spectroscopic data also indicate that there is little or no oxide layer surrounding the Cu nanostructures grown by ac electrodeposition. The effect of pH of the cobalt plating solution on the magnetic properties of the Co/AAO assemblies was also investigated. Co nanowire arrays electrodeposited at pH 5.5 in H2SO4-grown AAO templates exhibit a fair coercivity of 1325 Oe, a magnetization squarness of about 72%, and a significant effective anisotropy
    corecore